\chapter{Lasso TAR的精细矩阵表达}
对于一个TAR模型，可以写为，
\[ y_t= \phi^{(j)} + \sum_{i=1}^{p} \phi^{(j)}_iy_{t-i} + \sigma_j\eta_t \; \text{for}\; r_{j-1}<y_{t-d}<r_j \]

其中$ j =  1,\cdots,m+1$是体制的个数，$ r $是阈值，$ d $是延迟期数。

如果阈值变量是延迟$ d $期的$ y $，也即$\bm{Y} = (y_{1-d} ,y_{2-d},\cdots,y_{n-d})^T$。具体在估计步骤上，
\paragraph{重排序}要首先将包含$ n $个观测值的阈值变量重新排序，得到$ (y_{\pi(1)} ,y_{\pi(2)},\cdots,y_{\pi(n)})^T $，然后可以反推出如相应的自变量和因变量，如，
\[ \bm{Y}_n^0 = (y_{\pi(1) + d} ,y_{\pi(2) + d},\cdots,y_{\pi(n) + d})^T \]

其中，$ \pi(i)$是$ \bm{Y} $中第$ i- d $个小的时间脚标。
\paragraph{模型表达}接下来，定义相应的参数向量和误差向量，
\begin{align*}
\bm{\theta}(n) = & (\bm{\theta}_{\pi(1)}^T ,\bm{\theta}_{\pi(2)}^T,\cdots,\bm{\theta}_{\pi(n)}^T)^T\\
\bm{\varepsilon}(n)= & (\bm{\varepsilon}_{\pi(1)+d}^T ,\bm{\varepsilon}_{\pi(2)+d}^T,\cdots,\bm{\varepsilon}_{\pi(n)+d}^T)^T
\end{align*}
其中，$ \bm{\theta}_{\pi(1)}=\bm{\phi}_1,\bm{\theta}_{\pi(t_j)}=\bm{\phi}_{j+1}-\bm{\phi}_j,t_j \in \{2,\cdots,n\} $。对这种表述的几个解释：
\begin{itemize}
	\item $\bm{\phi}_j$实际上对应于不同体制的回归系数，而我们这里回归出来的系数$ \bm{\theta}_{\pi(t_j)} $，当你展开式以后会发现，每往后移动一组观测（对应于$ \bm{Y}_{\pi(t_j)}^T $），如果这个$ \bm{\theta}_{\pi(t_j)} $不为0，那么新的体制的回归系数$ \bm{\phi}_j $就是前一个$ \bm{\theta}_{t_j} $与后一个$ \bm{\theta}_{t_{j+1}} $的和。
	\item $ t_j $的使用是有意思的，这个模型设置相当于每一个阈值的观测都可以当做潜在的阈值，因此除去第一个观测，从2至$ n $都是可以的，这也就是$ t_j\in \{2,\cdots,n\} $的含义。
\end{itemize}

接下来，再定义自变量矩阵$ n\times np $维的$ \bm{X}_n $如下，
\[\bm{X}_n = \begin{pmatrix}
\bm{Y}_{\pi(1)}^T & 0 & 0 &\cdots& 0\\
\bm{Y}_{\pi(2)}^T& \bm{Y}_{\pi(2)}^T&0&\cdots&0\\
\bm{Y}_{\pi(3)}^T& \bm{Y}_{\pi(3)}^T&\bm{Y}_{\pi(3)}^T&\cdots&0\\
\vdots& & & \ddots & \vdots\\
\bm{Y}_{\pi(n)}^T& \bm{Y}_{\pi(n)}^T&\bm{Y}_{\pi(n)}^T&\cdots&\bm{Y}_{\pi(n)}^T\\
\end{pmatrix} \]
注意每一行都是重复的。这种排列的好处在于方便地得到阈值估计。因为此时，TAR可以写成，
\[ \bm{Y}_n^0= \bm{X}_n\bm{\theta}(n)+\bm{\varepsilon}(n) \]

估计的$ \bm{\hat\theta}_{\pi(j)}\ne 0 $就意味着这里有一个体制转换。

\paragraph{模型表达的具体例子}
对于一个三个变量两阶滞后的向量自回归，其第一个方程可以具体书写如下，

\begin{landscape}
\setcounter{MaxMatrixCols}{15}
\begin{equation*}
 \begin{pmatrix}
y_{11}\\ y_{12}\\y_{13}\\\vdots\\ y_{1n}
\end{pmatrix} =\begin{pmatrix}
y_{10}& y_{20}& y_{1,-1}& y_{2,-1}& 0 &\cdots&&&&&&&& &0\\
y_{11}& y_{21}&  y_{1,0}& y_{2,0}& \color{red} y_{11} &\color{red} y_{21} &\color{red} y_{1,0}&\color{red} y_{2,0}&0&\cdots&&&&&0\\
y_{12}& y_{22}&  y_{1,1}& y_{2,1}&\color{red}y_{12}&\color{red} y_{22}& \color{red} y_{1,1}&\color{red} y_{2,1}&y_{12}& y_{22}&  y_{1,1}& y_{2,1}&0&\cdots&0 \\
\vdots&\ddots&&&&&&&&&&&&&\vdots\\
y_{1,n-1}&y_{2,n-1}&y_{1,n-2}&y_{2,n-2}& \color{red}y_{1,n-1}&\cdots& &&&&&&&y_{1,n-2}& y_{2,n-2}\\
\end{pmatrix}\begin{pmatrix}
\bm{\theta}_{\pi(1)}\\\bm{\theta}_{\pi(2)}\\\bm{\theta}_{\pi(3)}\\\vdots\\\bm{\theta}_{\pi(n)}
\end{pmatrix}\end{equation*}
\end{landscape}

注意到，第一行对应第一个排序后的因变量观测，它的自变量只由其对应的滞后构成。第二行对应第二个排序后的因变量观测，它的自变量有其对应的滞后以及它的一个copy构成，对应的系数分别为$\bm{\theta}_{\pi(1)},\bm{\theta}_{\pi(2)}  $，以此类推各行。

此时使用lasso的组压缩估计，只要向量$ \bm{\theta}_{\pi(j)} $中存在非零系数，就意味着从这个观测往后，它的系数都要加上一个$ \bm{\theta}_{\pi(j)} $，意即体制转换出现了。

\paragraph{模型的估计}

